3 research outputs found

    Prototype of an intelligent system for information retrieval on the Web

    Get PDF
    En este trabajo se propone un modelo para consultar y decidir qué documentos satisfacen los deseos del usuario en consultas generalizadas en Internet. El modelo está constituido por tres partes esenciales, a saber: La teoría sicolingüística bajo la cual se plantean los modelos mentales de un individuo, el modelo propuesto para realizar búsqueda y, por último, la explicación del prototipo de software desarrollado que apoya el modelo. Los últimos capítulos son reservados para analizar el desempeño del modelo y del prototipo. Los investigadores sicolingüistas durante los últimos años han desarrollado varias teorías que intentan describir la forma cómo el ser humano organiza en su mente las abstracciones del mundo real y cómo se interpreta el lenguaje escrito mentalmente. La propuesta generalizada ha sido la Teoría De Rasgos Conceptuales, la cual será tratada a fondo en el primer capítulo. Como segundo punto, se propone una metodología y un modelo que servirán a un agente para decidir acerca de la relevancia de un documento para el usuario. En este caso la semántica apunta hacia la revisión de los párrafos como unidad de interpretación del texto, y es bajo este esquema que se propone un método de interpretación del documento para decidir si el texto auscultado contiene o no los conceptos propuestos por el usuario.Instituto Tecnológico de Estudios Superiores de Monterrey ITESMINTRODUCCIÓN 1 1. PALABRAS Y SIGNIFICADO 3 1.1. PALABRAS Y PRIMITIVOS LÉXICOS 4 1.1.1 Factores que influyen en el acceso y organización de las palabras 6 1.1.2 Modelos de Acceso Léxico 9 1.2 SIGNIFICADO 12 1.2.1 Primitivos Conceptuales 13 1.2.2 Teorías 14 1.2.3 Organización Conceptual 18 2. EL PÁRRAFO Y EL TEXTO 23 2.1 MECANISMOS PARA IDENTIFICAR LA IDEA PRINCIPAL EN UN PÁRRAFO 24 2.2 DEL PÁRRAFO AL TEXTO 25 3. EL MODELO DE PARTICIÓN DE CONCEPTOS COMO ESTRATEGIA PARA BUSCAR DOCUMENTOS EN INTERNET 27 3.1. BUSCANDO INFORMACIÓN EN WEB 28 3.1.1. Estrategias De Búsqueda Existentes En La Web A Través De Los Motores De Búsqueda Estándar 31 3.2. EL MODELO PROPUESTO 32 3.2.1. Los Documentos Buscados 33 3.2.2. El Usuario y Las Herramientas de Búsqueda 34 3.2.3. La Formulación del Deseo Del Usuario 37 3.2.4. Conceptos y Rasgos Conceptuales 41 3.2.5. La Partición de Conceptos 43 3.2.6. Construcción de la Partición de Conceptos basado en el Deseo del Usuario 46 4. ALGORITMO DE DECISIÓN DE UN AGENTE QUE BUSCA DOCUMENTOS EN INTERNET BASADO EN UNA PARTICIÓN DE CONCEPTOS 51 4.1. MODELO DE DECISIÓN 53 SOLICITUD DE DOCUMENTOS A INTERNET 60 5. PROTOTIPO DE UN BUSCADOR DE DOCUMENTOS BASADO EN LA TEORÍA DE RASGOS CONCEPTUALES 61 6. COMPARACIÓN CON OTROS TRABAJOS SIMILARES 87 6.1. MODELOS DE BÚSQUEDA BASADOS EN ESTRUCTURAS CONCEPTUALES 87 6.2. UNA APLICACIÓN DE BUSQUEDA BASADA EN CONCEPTOS 88 6.3. COMPARACIONES 90 7. CURVAS DE PRECISION Y RECALL COMPARADAS CON LAS DEL MOTOR DE BÚSQUEDA DE YAHOO 93 7.1. EL MODELO DE RASGOS CONCEPTUALES COMO ESTRATEGIA DE BUSQUEDA EN INTERNET. 93 7.2. RECALL Y PRECISION. 94 7.3. EL PROTOTIPO Y LOS EXPERIMENTOS 95 7.4. LAS PARTICIONES DE CONCEPTOS EN LAS PRUEBAS 97 7.5. ANALISIS DE RESULTADOS 97 8. CONCLUSIONES 102 REFERENCIAS Y BIBLIOGRAFÍA 103 ANEXOS 106MaestríaIn this work a model is proposed to consult and decide which documents satisfy the wishes of the user in general inquiries on the Internet. He The model is made up of three essential parts, namely: The theory psycholinguistics under which the mental models of an individual, the proposed model for searching and, finally, the explanation of the prototype developed software that supports the model. The last chapters are reserved for analyzing model and prototype performance. Psycholinguistic researchers in recent years have developed several theories that attempt to describe the way humans organize in their minds the abstractions of the real world and how written language is interpreted mentally. The generalized proposal has been the Theory Of Traits Conceptual, which will be treated in depth in the first chapter. As a second point, a methodology and a model are proposed that will serve a agent to decide about the relevance of a document to the user. In In this case, the semantics points towards the revision of the paragraphs as a unit of interpretation of the text, and it is under this scheme that a method of interpretation of the document to decide whether or not the monitored text contains the concepts proposed by the user.Modalidad Presencia

    A System for Converting and Recovering Texts Managed as Structured Information

    Get PDF
    This paper introduces a system that incorporates several strategies based on scientific models of how the brain records and recovers memories. Methodologically, an incremental prototyping approach has been applied to develop a satisfactory architecture that can be adapted to any language. A special case is studied and tested regarding the Spanish language. The applications of this proposal are vast because, in general, information such as text way, reports, emails, and web content, among others, is considered unstructured and, hence, the repositories based on SQL databases usually do not handle this kind of data correctly and efficiently. The conversion of unstructured textual information to structured one can be useful in contexts such as Natural Language Generation, Data Mining, and dynamic generation of theories, among others